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@ Verfahren zur Verbesserung der Spracherkennung unter Berucksichtigung verschiedener digitaler 
Codierbedingungen 

(g) Um eine optimale Spracherkennung zu ermoglichen, wird 
zunachst dasjenige Codierverfahren ermittelt, welches bei 
einer uber ein Kornmunikationsnetz ankommenden Sprach- 
auBerung angewendet worden ist. Dieses Ermittlungsergeb- 
nis soil dazu dienen, die Quatitat einer Spracherkennung 
wesentlich zu erhohen. 

Es sind mehrere Spracherkenner vorgesehen, wovon jeder 
einzelne fur ein ganz bestimmtes Codierverfahren zustandig 
ist. Die Wortmodetle eines jeden Spracherkenners wurden 
aus SprachauBerungen erzeugt, die nach dem betreffenden 
Verfahren codiert waren. Die aus einer aktuellen, zu erken- 
nenden SprachauSerung errechneten Merkmalsvektoren 
werden einem Codeerkenner angeboten, in welchem fur 
jedes Codierverfahren ein aus den Merkmalsvektoren der 
entsprechenden Referenzmuster errechneter Mittelwert ab- 
gespeichert ist. Es findet ein Vergleich dieser Mitteiwerte 
mit den Merkmalsvektoren der zu erkennenden SprachauSe- 
rung statt. Mit der sich dabei ergebenden geringsten 
Differenz ist dann dasjenige Codierverfahren erkannt wor- 
den, mit dem die zu erkennende SprachauSerung codiert 
wurde. Daraufhin wird derjenige von mehreren Spracher- 
kennern aktiviert, der fur das betreffende Codierverfahren 
zustandig ist. 

Durch schnelle Ermitttung desjenigen Codierverfahrens, 
welches bei einer ankommenden, zu erkennenden Sprach- 
auSerung angewendet wurde, wird durch den darauf spezia- 
lisierten Spracherkenner eine hohe Qualitat der Erkennungs- 
ergebnisse erreicht, die auch bei Codierverfahren mit niedri- 
ger ... 

Die folgenden Angaben sind den vom Anmelder eingereichten Unterlagen entnommen 
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Beschreibung 



Die Erfindung betrifft ein Verfahren zur Verbesse- 
rungderSpracherkennung unter Beriicksichtigung ver- 
sch.edener digitaler Codierbedingungen nach dem 5 
Oberbegnff des Patentanspruchs 1. 

Ein MeOverfahren zum Beurteilen der Gute von 
Sprachcodierern und/oder Obertragungsstrecken ist 
beschr.eben in der DE 37 08 002 Al. In der Beschrei- 
bungsemle.tung (Spalte 2) ist angegebeii, daB die Art 10 
des Codierverfahrens und audi die Beschaffenheit einer 
Ubertragungsstrecke einen groBen EinfluB haben auf 
die Sprachgiite und die Verstandlichkeit der an einen 
Empfanger ankommenden Sprachinformation. In dieser 

SS iin W ' r t ei " ^1° verfahren angegeben, wobei mit 15 
Hilfe ernes Spracherkenners oder eines Sprechererken- 

kt f H « St f Ste "!. Wird o Wie groB die Wahrscheinlichkeit 
I JZ abgegebene SprachauBerungen richtig erkannt 
-4 rru H ' erbei Werden ver schiedene Sprachcodierer 
Oder Ubertragungsstrecken in den Sprechweg einge- 20 
sch e.ft so daB festgestellt werden kann, wie groB der 
Anteil der nchtig erkannten SprachauBerungen bei un- 
tersch.edi.chen Codierverfahren ist Mit einem derarti- 
gen Verfahren kann festgestellt werden, welches der 
IZ\°S if" 6 " Codierverf ahren fur eine elektronische 25 
Spracherkennung am geeignetsten ist und bei welchen 
Codierverfahren eine mindere Qualitat der Spracher- 
kennung zu erwarten ist. Hierfiir wird ein einziger 
Spracherkenner benutzt, der vorgegebene SprachauBe- 
rungen ubermittelt bekommt und diese erkennt. Dabei 30 
werden jeweils d.e vorher bekannten wahren Bedeutun- 
gen mit den erkannten Ergebnissen verglichen. Eine An- 
passung des Spracherkenners an ein Codierverfahren 
nndet nicht statt. 

m-^t der ^, 43 ? f ? 404 A1 ist ein ^rfahren zum Er- 35 
mmeln und Klasstfizieren von Storgerauschtypen be- 
kannt. Damn soli erreicht werden, daB ein Spracherken- 
^IJ P T an eir l. erkanntes Storgerausch angepaBt 
Zu dt^T' dlC SP r «*erkennung zu optimieren. 
Zu diesem Zweck sind sogenannte Codebuch-Speicher « 
vorgesehen, welche die Referenzmuster der jeweils zu 
erkennenden SprachauBerungen enthalten. AuBer ei- 
nem Standardcodebuch, in welchem die Referenzmu- 
ster der re.nen Sprache enthalten sind, ist fur jeden zu 
erkennenden Gerauschtyp ein eigenes Codebuch erfor- 45 
derhch. Diese Referenzmuster miissen zusammen mit 
dem jeweil.gen Gerausch durch einen Trainingsvorgang 
erstellt werden. Eine zu erkennende SprachauBerung 
wird einer Sprachanalyseeinheit angeboten, die Merk- 
malsvektoren b.ldet und die Haufigkeitsverteilungen, 50 
die aus einer Vektorquantisierung resultieren, ebenfalls 
ermittelt. Es mussen nun umfangreiche Vergleichsrech- 
nungen stattfmden, um die abgelegten Indexdaten mit 
Z n rJ£ Ve ^uamisierung der eingegebenen 

SprachauBerung sich ergebenden Haufigkeitsverteilun- 55 
gen zu vergleichen. Der sich bei diesem Rechenvorgang 
ergebende Extremwert der Differenzen kennzeichnel 
e.nen gefundenen Storgerauschtyp. Daraufhin wird 
dann dem Spracherkenner das zu diesem Storgerausch- 
typ passende Codebuch zugeschaltet, womit dann die 60 
Spracherkennung stattfinden kann. 

Obwohl bei diesem Verfahren bereits gegenuber vor- 
bekannten Anordnungen eine Reduzierung der Spei- 
cherkapazitat und der Rechenleistung erreicht wurde 
ist der Aufwand dennoch relativ hoch. AuBerdem wer- « 
den bei einem derartigen Verfahren Einfliisse von Co- 
dierverfahren. wie sie auf Obertragungsstrecken einge- 
setzt werden, nicht beriicksichtigt. 



Die Aufgabe der Erfindung besteht darin, ein Verfah- 
IT„ a " zugeb 5 n - mit d em dasjenige von mehreren be- 
kannten Codierverfahren ermittelt werden kann wel- 
ches bei einer zu erkennenden aktuellen SprachauBe- 
rung angewendet worden ist. Daraufhin soli ein Sprach- 
erkenner eingesetzt werden, dessen zugehorige Refe- 
renzmuster mit diesem Codierverfahren erstellt wurden 
damn optimale Ergebnisse erreicht werden, wenn Qber 
werdeTsoH n aUOnSnetZ " bertragene S P rach « erkannt 
Zur Losung dieser Aufgabe ist eine Merkmalskombi- 
benTt V ° rgesehen ' wie sie im Patentanspruch 1 angege- 

Damit wird in vorteilhafter Weise erreicht, daB ein 
Codierungsverfahren, welches bei einer iiber ein Kom- 
W s , ,Sf t,0 f f SnetZ ankom ™nden, zu erkennenden 
S^prachauBerung angewendet wurde, schnell gefunden 
wird. Daraufhin wird derjenige Spracherkenner ange" 

lelZ i« t her / Qr d L 6SeS ? dierv ^fahren optimal aus- 
gelegt ist Somit ergibt sich eine hohe Qualitat bei der 

fSSS^J^SSiff Codierverfahren mit 

Un^antrSe g n der ErfindUn§ e * eben Sich ™ den 
Jjf A "sfuhrungsbeispiel der Erfindung wird nachfol- 
gend anhand einer Zeichnung naher erlautert. In der 
™™ ™"u g f 1 ^enjatisch dargestellt, wie eine von ei- 
nem Mikrofon M aufgenommene sprachliche AuBerung 
uber ein Kommunikationsnetz KN an den Eingang E 
emer Sprachanalyse-Einrichtung SPA gelangt. Auf dem 
Ubertragungsweg innerhalb des Kommunikationsnet- 
zes KN sind ublicherweise Codiereinrichtungen CD 
vorgesehen. Es kann nicht unbedingt davon ausgegan- 

fZ7Z Cn ' ct 6 A die am Eingang E einer Sprachalaiyse- 
Emnchtung SPA anstehende, zu erkennende sprachli- 
che AuBerung immer mit dem gleichen Codierverfahren 
angeboten wird. Um eine hohe Qualitat bei der Sprach- 
erkennung zu erreichen, soil zunachst herausgefunden 
werden, welches Codierverfahren innerhalb des Kom- 
munikationsnetzes KN angewendet wurde 

In der Sprachanalyse-Einrichtung SPA wird eine zu 
erkennende SprachauBerung, beispielsweise ein Wort, 
in zeithche Abschnitte zerlegt, wovon in bekannte Wei- 

M.^ er ^ llai , SVekt0ren MV err <*hnet werden. Diese 
Merkmalsvektoren MV werden der Reihe nach in ei- 
nem Merkmalsvektorspeicher MVSP abgelegt Von 
dort aus werden sie einem Codeerkenner CE angebo- 
ten, welcher diese Merkmalsvektoren MV mit Mittel- 
werten MW1 bis MWn vergleicht, welche aus Merk- 
malsvektoren gebildet wurden, die beim Trainieren von 
Wortmustern entstanden sind. Jeder einzelne dieser 
Mmelwerte MWl bis MWn stammt dabei aus Merk- 
malsvektoren, welche einem bestimmten Codierverfah- 
ren zugeordnet sind. das heiBt, diese Merkmalsvektoren 
wurden von SprachauBerungen gewonnen, die unter 
Einsatz des betreffenden Verfahrens codiert wurden. 
Beim Vergleichen der von einer aktuellen SprachauBe- 
rung gewonnenen Merkmalsvektoren MV mit den im 
Codeerkenner CE abgelegten Mittelwerten MWl bis 
Z^VT n ! 1C u h mehr oder we ™ger groBe Differen- 

w?r;Mw e I , K W '^«r aU i gefunden ' bei welchem Mittel- 
wert MWl bis MWn sich die geringste Differenz ergibt . 

Da derjenige Mittelwert, z. B. MWl, bei dem sich die 
geringste Differenz beim Vergleichen mit den Merk- 
malsvektoren MV der aktuellen SprachauBerung ergibt 
einem Codierverfahren zugeordnet ist, ist dieses somit 
als dasjenige erkannt worden, welches innerhalb des 
K-ommunikationsnetzes KN angewendet wurde Wenn 
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der Codeerkenner CE ein derartiges Ergebnis, das heiBt 
die geringste Differenz. festgestellt hat, so wird ein 
Schaltmittel SM angesteuert, um einen von mehreren 
Spracherkennern SE1 bis SEn anzusteuern. Unter der 
Annahme, daB im Codeerkenner CE die geringste Diffe- 5 
renz zwischen dem Mittelwert MW1 und den aus einer 
aktuellen SprachauBerung ermittelten Merkmalsvekto- 
ren MV erkannt wird, wird uber das Schaltmittel SM der 
Ausgang des Merkmalvektorspeichers MVSP mit dem 
Eingang des Spracherkenners SE1 verbunden. Die in ;o 
diesem Spracherkenner SE1 abgelegten Referenzmu- 
ster fiir zu erkennende Worte sind in bekannter Weise 
wahrend einer Trainingsphase entstanden, wobei das 
betreffende Codierungsverfahren, beispielsweise 
ADPCM. angewendet wurde. Dieser Spracherkenner 15 
SE1 liefert deshalb bessere Ergebnisse als einer der an- 
deren Spracherkenner SE2 bis SEn liefern wurde. Somit 
erscheint am Ausgang A bei jedem Codierverfahren, fur 
welches jeweils ein Spracherkenner SE1 bis SEn vorge- 
sehen ist, ein optimales Erkennungsergebnis. 20 

Die mit diesem Verfahren erzielbaren Ergebnisse 
konnen noch weiter gesteigert werden, wenn innerhaib 
des Codeerkenners CE nicht nur einzelne Mittelwerte 
MW1 bis MWn gespeichert sind, sondern auch die Ko- 
varianzen, welche sich aus den beim Training erzeugten 25 
Merkmalsvektoren ergeben. Diese Kovarianzen sind 
dann in einem Speicher des Codeerkenners CE bezogen 
auf das jeweilige Codierverfahren abgelegt. In diesem 
Fall werden von den Merkmalsvektoren MV der aktuel- 
len Sprachanalyse die Werte von GauBschen Vertei- 30 
lungskurven produziert, so daB einzelne Dichtewerte 
miteinander verglichen werden konnen. Mit diesem er- 
hohten Aufwand kann die Erkennungssicherheit we- 
sentlich gesteigert werden. 

AuBerdem ist es moglich, mehrere aus ein und dersel- 35 
ben Verbindung stammende SprachauBerungen im Co- 
deerkenner CE nach der vorbeschriebenen Weise zu 
untersuchen, wobei jede sich bei einer einzelnen 
SprachauBerung ergebende Differenz zwischen deren 
Merkmalsvektoren MV und den Mittelwerten MW1 bis 40 
MWn zwischengespeichert wird. Diese einzelnen Diffe- 
renzwerte werden dann bezogen auf jeden einzelnen 
Mittelwert MW1 bis MWn getrennt aufsummiert, so 
daB der dann sich ergebende geringste Summenwert 
das angewandte Codierverfahren genauer bestimmen 45 
kann. Somit kann einer der Spracherkenner SE1 bis SEn 
mit groBerer Sicherheit als der am besten passende aus- 
gewahlt werden. 
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i. Verfahren zur Verbesserung der Spracherken- 
nung unter Berucksichtigung verschiedener digita- 
ler Codierbedingungen mit niedriger Bitrate, wobei 
durch Training mit mehreren Sprechern gewonne- 55 
ne Wortmodelle abgespeichert sind, die ais Refe- 
renzmuster zum Vergleich mit zu erkennenden 
Worten dienen, damit die Vergleichsergebnisse mit 
einer hohen Erkennungswahrscheinlichkeit vorlie- 
gen, so 
dadurch gekennzeichnet, 

daB mehrere Spracherkenner (SPE1 bis SPEn) vor- 
gesehen sind wovon jeder einzelne fur ein ganz 
besnmmtes Codierverfahren, z. B. PCM mit 64 
kBit/s, ADPCM, CELP nach CCITT G728, zustan- 6 5 
dig ist, wobei die darin befindlichen Referenzmu- 
ster der Wortmodelle mit dem zugehorigen Codier- 
verfahren erzeugt wurden, 



daB eine zu erkennende SprachauBerung zunachst 
einer Sprachanalyse-Einrichtung (SPA) zugefuhrt 
wird, welche daraus Merkmalsvektoren (MV) er- 
zeugt, die anschlieBend in einen Merkmalsvektor- 
speicher (MVSP) gelangen, 

daB die Merkmalsvektoren (MV) einem Codeer- 
kenner (CE) angeboten werden, in welchem fur je- 
des Codierverfahren ein aus den Merkmalsvekto- 
ren der entsprechenden Referenzmuster errechne- 
ter Mittelwert (MW1 bis MWn) abgespeichert ist, 
daB die Merkmalsvektoren (MV) der zu erkennen- 
den SprachauBerung mit jedem dieser Mittelwerte 
(MW1 bis MWn) verglichen werden, wobei die ge- 
ringste Differenz uber alle Merkmalsvektoren 
(MV) einer SprachauBerung ermittelt wird, welche 
dann dasjenige Codierverfahren kennzeichnet, mit 
dem die zu erkennende SprachauBerung codiert 
wurde, 

und daB dann derjenige von mehreren Spracher- 
kennern (SPE1 bis SPEn) mit dem Merkmaisvek- 
torspeicher (MVSP) verbunden wird, der fur das 
erkannte Codierverfahren zustandig ist, um die ei- 
gentliche Spracherkennung durchzufuhren. 

2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB der Codeerkenner (CE) beim Verglei- 
chen der Mittelwerte (MW1 bis MWn) mit den 
Merkmalsvektoren (MV) auch deren Kovarianzen 
in Form einer GauB-Verteilung berucksichtigt, in- 
dem einzelne Dichtewerte miteinander verglichen 
werden. 

3. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB bei mehreren untersuchten Sprachau- 
Berungen die bei vorangegangenen Ermittlungen 
erkannten Differenzen berucksichtigt werden, in- 
dem die einzelnen sich ergebenden Differenzen 
zwischen den Merkmalsvektoren (MV) und den 
Mittelwerten (MW1 bis MWn) fQr jedes Codierver- 
fahren aufsummiert werden, wobei die geringste 
Summe das erkannte Codierverfahren kennzeich- 
net. 

4. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB elektronische Schaltmittel (SM) vor- 
gesehen sind, womit der Merkmalsvektorspeicher 
(MVSP) mit dem entsprechenden Spracherkenner 
(z. B. SPE1) verbindbar ist, und daB diese Schaltmit- 
tel (SM) vom Codeerkenner (CE) direkt gesteuert 
werden. 
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